ChatGPT 開發手冊 Turbo×Vision 進化版—用 OpenAI Chat/Assistants API‧Function calling 設計 GPTs action‧LINE/Discord bot‧股市分析/自動助理

NT $ 647




在ChatGPT帶起生成式AI百家齊放的新世紀,整合語言模型已勢不可擋。隨著OpenAI釋出更厲害的新模型與整合度更高的API,善用語言模型理解文意與能言善道的超強特性,邁入『自然語言就是程式語言』的願景已經不再是夢想。終端用戶將使用自然語言操控應用程式,由語言模型自主理解規劃邏輯流程,我們的程式則是語言模型背後的軍火庫,串接外部各式各樣的功能。

|用真實上線的GPTs學action開發|

即使GPTs已經提供搜尋網路、上傳檔案的功能,仍然無法隨意取用外部功能,因此GPTs最關鍵的環節就是action外掛系統,讓語言模型與外界接軌。本書會帶大家用真實上線的台鐵時刻表查詢專家當範例,手把手教你設計GPTsaction,補強客製GPTs欠缺的功能。

|串接GoogleOAuth2API管控action使用者|

客製的GPTs要能針對不同使用者提供客製服務才是真客製,本書會說明如何串接GoogleOAuth2API,幫GPTsaction加上登入Google帳號機制,以便後端程式可以根據登入的使用者提供不同的服務,設計出真正客製的ChatGPT。

|Chat/AssistantsAPI全解析|

AssistantsAPI是OpenAIAPI家族的大禮,以往我們必須自己處理的對話記錄、網路搜尋、向量資料庫、程式執行工具、文字生圖等等功能,現在全部整合在AssistantsAPI中,成為實作AI助理的基石。本書會帶大家深度瞭解ChatAPI與AssistantsAPI的差異,讓你針對問題挑選適當的API。

|深入functioncalling機制|

即使是最新的gpt-4模型,訓練資料也僅止於2023年4月,模型本身也不能連網取得新知,更無法介接外部API。透過functioncalling機制,就可以撰寫各式各樣的函式作為延伸語言模型能力的外掛,任由模型取用。新版模型更強化功能,提供parallelfunctioncalling,即使複雜問題也能自動分解由多個函式完成。

|整合gpt-4-vision模型|

gpt-4-vision讓模型長眼睛,本書就利用這項功能結合codeinterpreter工具,帶大家製作一個給它網頁截圖就能模仿生出近似網頁檔的助理,甚至還可以幫你從其他語言的API串接程式碼生成JavaScript程式碼,以後看到欣賞的網頁,就可以透過這種方式快速學習設計方法。

|透過AssistantsAPI讓語言模型幫你生SQL|

SQL語法博大精深,有的時候我們很明確知道想要從資料庫裡找出什麼結果,但就是沒辦法把SQL語句寫對,本書特別展示了一個簡單的小助理,讓你用說的就能操作資料庫。

|利用Retrieval工具設計RAG助理|

AssistantsAPI除了能夠記錄對話,還提供額外的工具,其中Retrieval工具免除我們自己將文件分段作embedding以及管理/存取向量資料庫的麻煩,只要把檔案丟給它,就可以快速開發檢索增強式生成(RAG,RetrievalAugmentedGeneration)助理。

|善用AssistantsAPI開發LINE/Discordbot|

用語言模型幫即時通訊軟體長大腦,變成隨身客製版的ChatGPT,不但能理解文字,還能創意生圖改圖,也能分析股市,更能看圖說故事。

|設計字幕與旁白自動生成助理|

加字幕是拍片後最繁瑣的工作,透過Whisper模型,就可以自動從語音轉出加上時間點的字幕檔,或者也可以反向從字幕檔利用TTS模型生成旁白音檔,有效提升自媒體工作效率。

|微軟AzureOpenAIAPI差異說明|

除了OpenAI自己,微軟的Azure平台也提供有OpenAIAPI,這兩個看似系出同門的API在使用上卻存在一些差異,如果沒有注意,就可能落入陷阱,本書已經幫你測試過,協助你無縫接軌轉移應用程式到Azure平台。

|設計串流即時輸出的聊天架構|

想要像是ChatGPT可以即時顯示生成內容,避免讓使用者痴痴等待全部內容生成,沒問題,OpenAI也提供有串流模式,本書也將串流功能與functioncalling整合進聊天框架,讓你可以快速實作出具備即時顯示、又可彈性增減外部功能的對答程式。

|詳解OpenAIAPI個別參數|

不想被語言模型弄瘋,就要瞭解OpenAIAPI的各項參數,才能掌握語言模型生成的各種變數,怎樣可以讓語言模型生成內容避開不想要出現的字詞?怎樣可以讓語言模型選用偏好的字詞?為什麼生出內容有怪怪的東西?這些都可以透過API的參數控制,如果不瞭解參數,就只能任由語言模型恣意亂為了。
本書特色:
‣解析實際上線的GPTs學會action開發
‣串接Google帳號認證GPTsaction使用者身分
‣善用AssistantsAPI設計Discord股票分析助理
‣結合gpt-4-vision/codeinterpreter設計看圖生成網頁的自動助理
‣使用AssistantsAPI用說的就能操控SQL資料庫
‣利用functioncalling幫LINEAI機器人突破限制開外掛
‣整合OpenAIImageAPI設計AI文字生圖/改圖/修圖工具
‣詳解OpenAIAPI參數/掌握語言模型輸出變化
‣實作自動字幕/旁白產生器
‣微軟AzureOpenAIAPI差異說明,無縫接軌轉移應用程式到Azure平台


TTS AZURE 資料庫 GOOGLE 程式 OPENAIAPI CHATAPI DISCORD AI SQL 助理 客製 字幕 模型 JAVASCRIPT 整合 工具 GPTS API 語言 應用程式 CALLING 使用者 EMBEDDING


教父
NT $ 409